class: title-slide, left, top ## Estimando curvas de adquisición léxica en la infancia **Gonzalo Garcia-Castro**<sup>1</sup>
@gongcastro
gonzalo.garciadecastro@upf.edu **Alicia Franco-Martínez**<sup>2</sup>
@AliciaFrancoXVE **Cristina Rodríguez-Prada**<sup>2</sup>
@crodriguezprada **Ignacio Castillejo**<sup>2</sup>
@IndaloNacho **Núria Sebastian Galles**<sup>1</sup> 17/07/2022 <a href="https://gongcastro.github.io/aemcco_2022_trajectories" class="github-corner" aria-label="View source on Github"><svg width="80" height="80" viewBox="0 0 250 250" style="fill:#fff; color:#151513; position: absolute; top: 0; border: 0; right: 0;" aria-hidden="true"><path d="M0,0 L115,115 L130,115 L142,142 L250,250 L250,0 Z"></path><path d="M128.3,109.0 C113.8,99.7 119.0,89.6 119.0,89.6 C122.0,82.7 120.5,78.6 120.5,78.6 C119.2,72.0 123.4,76.3 123.4,76.3 C127.3,80.9 125.5,87.3 125.5,87.3 C122.9,97.6 130.6,101.9 134.4,103.2" fill="currentColor" style="transform-origin: 130px 106px;" class="octo-arm"></path><path d="M115.0,115.0 C114.9,115.1 118.7,116.5 119.8,115.4 L133.7,101.6 C136.9,99.2 139.9,98.4 142.2,98.6 C133.8,88.0 127.5,74.4 143.8,58.0 C148.5,53.4 154.0,51.2 159.7,51.0 C160.3,49.4 163.2,43.6 171.4,40.1 C171.4,40.1 176.1,42.5 178.8,56.2 C183.1,58.6 187.2,61.8 190.9,65.4 C194.5,69.0 197.7,73.2 200.1,77.6 C213.8,80.2 216.3,84.9 216.3,84.9 C212.7,93.1 206.9,96.0 205.4,96.6 C205.1,102.4 203.0,107.8 198.3,112.5 C181.9,128.9 168.3,122.5 157.7,114.1 C157.9,116.9 156.7,120.9 152.7,124.9 L141.0,136.5 C139.8,137.7 141.6,141.9 141.8,141.8 Z" fill="currentColor" class="octo-body"></path></svg></a><style>.github-corner:hover .octo-arm{animation:octocat-wave 560ms ease-in-out}@keyframes octocat-wave{0%,100%{transform:rotate(0)}20%,60%{transform:rotate(-25deg)}40%,80%{transform:rotate(10deg)}}@media (max-width:500px){.github-corner:hover .octo-arm{animation:none}.github-corner .octo-arm{animation:octocat-wave 560ms ease-in-out}}</style> <div class="my-logo-left"></div> <div class="my-logo-center"></div> <div class="my-logo-right"></div> --- # Objetivo **Estimar la edad de adquisición de palabras en catalán y castellano en el Área Metropolitana de Barcelona** > Edad de adquisición: edad en la cual existe una representación mental estable, específica y sensible para una palabra (*comprension* o *producción*) * Obtener características de **estímulos experimentales** (e.g., dificultad) * Explorar **predictores** de la edad de adquisición de una palabra * **Portal de consulta** de edad normativa de acquisición --- class: # Instrumentos de medida .pull-left[ ### MB-CDI * Estado general de **desarrollo comunicativo** de un bebé entre los 10 y los 32 meses * Cumplimentado por una o dos personas a cargo del bebé * Adaptado a múltiples lenguas: [Wordbank](http://wordbank.stanford.edu/) (http://wordbank.stanford.edu/) * Inventario de palabras: ~400 ítems - No / Comprende (10-16 meses) - No / Produce (17-32 meses) * Tamaño de vocabulario: suma del número de respuestas *Comprende* o *Produce* * Ej.: 215 palabras, 53.75% comprende, pct 0.78 ] -- .pull-right[ ### Multilex * **1,600 ítems** (798 catalán, 802 castellano) * Participantes asignados aleatoriamente a una de **cuatro versiones** con ítems parcialmente solapados (~560 items, ~280 catalán ~280 castellano) * Paquete de R: {[**multilex**](https://gongcastro.github.io/multilex/)} [[GitHub](https://github.com/gongcastro/multilex)] .center[ <img src="data:image/png;base64,#../img/multilex.png" alt="multilex" width="100px"/> ] ] --- class: # Base de datos 417 participantes, 494 respuestas, 254,813 observaciones <img src="data:image/png;base64,#slides_files/figure-html/participants-plot-1.png" width="90%" height="40%" /> --- class: .pull-left[ **Variable de respuesta**: * `response`: *No* = 1, *Comprende* = 2, *Comprende y dice* = 3 **Variables del participante**: * `id`: identificador de participante (*grupos*) * `age`: edad en meses * `doe`: exposición a la lengua (proporción) ] .pull-right[ **Variables del ítem**: * `te`: identificador de traducción (*grupos*) * `item`: identificador de ítem * `freq`: frecuencia léxica * `n_phon`: número de fonemas ] -- <br> ``` ## # A tibble: 10 x 8 ## id age doe te item freq n_phon response ## <chr> <dbl> <dbl> <int> <chr> <dbl> <int> <ord> ## 1 bilexicon_642 10.2 0.5 1 cat_pessigolles 4.05 9 Understands ## 2 bilexicon_642 10.2 0.5 1 spa_cosquillas 3.83 8 Understands ## 3 bilexicon_634 10.7 1 1 cat_pessigolles 4.05 9 No ## 4 bilexicon_634 10.7 0 1 spa_cosquillas 3.83 8 No ## 5 bilexicon_878 10.8 0 1 cat_pessigolles 4.05 9 No ## 6 bilexicon_878 10.8 1 1 spa_cosquillas 3.83 8 No ## 7 bilexicon_1604 10.8 0.4 1 cat_pessigolles 4.05 9 No ## 8 bilexicon_1604 10.8 0.6 1 spa_cosquillas 3.83 8 No ## 9 bilexicon_1602 11.2 0.05 1 cat_pessigolles 4.05 9 No ## 10 bilexicon_1602 11.2 0.95 1 spa_cosquillas 3.83 8 No ``` --- class: # Modelo * **Ordinal**: No → Comprende → Comprende y dice) (función de enlace *logit*) * **Multinivel**: observaciones agrupadas por participant (`id`) e ítem (`te`) * **Bayesiano**: `\(P(\theta | y) \propto P(y|\theta) \times P(\theta)\)` - `\(y\)` = probabilidad de respuesta a categoría (*No*, *Comprende*, *Comprende y dice*) - `\(\theta\)` = el modelo y sus parámetros Implementación en **{brms}/Stan**
: ```r response ~ age_std + freq_std + n_phon_std + doe_std + (1 + age_std + freq_std + n_phon_std + doe_std | id) + (1 + age_std + freq_std + n_phon_std + doe_std | te), family = cratio(link = "logit") # cumulative, continuation ratio ) ``` --- class: center ## Distribución previa: predicciones previas --- class: center <img src="data:image/png;base64,#slides_files/figure-html/wordbank-aoa-1.png" width="70%" height="50%" /> --- class: # Resultados: Respuestas observadas <img src="data:image/png;base64,#slides_files/figure-html/response-distribution-1.png" width="70%" height="65%" /> --- class: ## Distribución posterior <img src="data:image/png;base64,#slides_files/figure-html/fixed-coefs-1.png" width="70%" height="40%" /> --- class: ## Predicciones posteriores --- class: ## Predicciones posteriores (2) --- class: <!-- --> --- class: <!-- --> --- class: <!-- --> --- class: # Conclusiones --- class: # Anexo 1: convergencia de cadenas --- # Anexo 2: convergencia de cadenas <img src="data:image/png;base64,#slides_files/figure-html/diagnostics-rhats-1.png" width="90%" height="80%" /> --- # Anexo 3: tamaño de muestra efectivo <img src="data:image/png;base64,#slides_files/figure-html/diagnostics-neffs-1.png" width="90%" height="80%" /> --- # Anexo 4: Variabilidad de coeficientes <img src="data:image/png;base64,#slides_files/figure-html/rand-coefs-1.png" width="90%" /> --- class: <img src="data:image/png;base64,#../img/agradecimientos.jpg" width="100%" height="100%" />